1
Da Probabilidade à Verossimilhança: A Ciência da Inferência
MATH003Lesson 6
00:00
A inferência estatística marca a transição de prever resultados com base em parâmetros conhecidos (probabilidade) para determinar quais parâmetros são mais compatíveis com os dados observados (verossimilhança). Enquanto uma função de densidade de probabilidade $f(x|\theta)$ descreve a distribuição dos dados $x$ para um $\theta$ fixo, a função de verossimilhança $L(\theta|x)$ trata os dados observados como fixos e varia o parâmetro $\theta$ para quantificar o suporte relativo a diferentes hipóteses.

O Princípio da Inversão

A função de verossimilhança é frequentemente expressa na forma da densidade conjunta. Para uma distribuição Normal com variância fixa, a verossimilhança é definida por:

$L ( \theta | x_1, \dots, x_n ) = \exp\left( -\frac{n}{2\sigma_0^2} (\bar{x} - \theta)^2 \right)$

Aqui, avaliamos a "plausibilidade" de diferentes valores de $\theta$ dado a média amostral $\bar{x}$. Para encontrar o pico dessa plausibilidade, utilizamos Definição 6.2.2: a verossimilhança logarítmica $l(\theta | s) = \ln L(\theta | s)$. Essa transformação simplifica produtos de observações independentes em somas, tornando a maximização de modelos complexos viável do ponto de vista computacional.

Exemplo Resolvido: Pesquisa de Alturas (EXEMPLO 6.3.5)

Os Dados

Considere uma amostra de $n=30$ alturas com um desvio padrão calculado de $s=2.379$. Usando o Modelo Normal de Localização-Escala, buscamos inferir a média verdadeira $\theta$.

Inferência e Precisão

O erro padrão é calculado como $s/\sqrt{30} = 0.43434$. Esse valor mede a "agudez" do nosso pico de verossimilhança. Um erro padrão menor implica um pico mais estreito e agudo, representando maior precisão em nossa inferência sobre $\theta$.

Dimensionalidade e Restrições

Em cenários complexos como EXEMPLO 6.1.5 (Modelos Multinomiais), devemos levar em conta dependências lógicas. Como observado, "Note que é realmente apenas bidimensional, porque assim que sabemos o valor de quaisquer dois dos $\theta_i$... imediatamente sabemos o valor do parâmetro restante." Essa restrição é fundamental para definir corretamente o espaço paramétrico $\Omega$.

Fundamentos Assintóticos

A ponte entre verossimilhança e inferência depende do Teorema Central do Limite. À medida que $n \to \infty$, a distribuição dos nossos estimadores converge. Especificamente, no EXEMPLO 6.5.4 Modelo de Bernoulli:

$Z = \frac{\sqrt{n}(\bar{X} - \theta)}{\sqrt{\bar{X}(1 - \bar{X})}} \xrightarrow{D} N(0, 1)$

Isso nos permite quantificar a incerteza usando intervalos z e valores-p, desde que tenhamos amostras suficientemente grandes.

🎯 Princípio Fundamental
Métodos de inferência sem distribuição exigem apenas suposições mínimas sobre a distribuição amostral, tornando-os robustos quando a família $\{P_{\theta} : \theta \in \Omega\}$ é muito grande. Em contraste, os métodos paramétricos de verossimilhança dependem da curvatura da log-verossimilhança, onde a Informação de Fisher $nI(\theta)$ determina a variância da nossa função escore.